FILTER MODE ACTIVE

#катастрофическое забывание

Найдено записей: 3

#катастрофическое забывание10.11.2025

Построение нейронных агентов с памятью: дифференцируемая память, мета-обучение и приоритизированный реплей для непрерывной адаптации

Руководство по созданию агента в PyTorch с дифференцируемой памятью, приоритизированным реплеем и мета-обучением, позволяющее адаптироваться к новым задачам без потери предыдущих навыков.

#катастрофическое забывание08.09.2025

Преимущество RL: исследование MIT показало, что обучение с подкреплением снижает катастрофическое забывание по сравнению с SFT

'MIT доказали, что on-policy обучение с подкреплением сохраняет ранее приобретённые способности лучше, чем супервизированное дообучение, за счёт минимизации прямого KL-расхождения между базовой и адаптированной моделью.'

#катастрофическое забывание17.06.2025

EPFL представляет MEMOIR: революционную систему для непрерывного редактирования моделей больших языковых моделей

Исследователи EPFL разработали MEMOIR — инновационную систему для непрерывного, надежного и локального обновления больших языковых моделей, которая превосходит существующие методы.